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【摘要 】 目 的 在 单个 率 Meta 分析 中 对 率 的 不 同 转换 方法 进行 比较 。 方 法 构造 两 套 模拟 
数据 进行 单个 率 的 Meta 分 析 ， 考 察 5 种 数据 转换 方法 不 转换 、 对 数 转换 、logit 转换 、 平 
方 根 反 正弦 转换 及 双重 反正 弦 转 换 ) 下 的 结果 ， 兼 顾 固定 效应 模型 和 随机 效应 模型 ， 及 事 
件数 为 零 时 增加 不 同 的 固定 值 。 计 算 汇 总 的 率 的 均值 Mean) ， 偏 倚 值 (Bias〉、 偏 倚 率 
(Proportion Bias) 、 误 差 均 方 (Mean Squared Error, MSE) 、 误 差 均 方 百分比 〈Proportion 
MSE) 及 95% 可 信 区 间 的 履 盖 率 〈Coverage) 。 结 果 对 基于 二 项 分 布 的 单个 率 进 行 Meta 分 
析 时 ， 平 方 根 反正 弦 转 换 总 体 表现 最 佳 。 当 事件 数 为 零 时 ， 增 加 不 同 的 固定 值 对 结果 影响 
较 大 ， 但 这 种 校正 对 不 转换 的 策略 没有 帮助 ， 甚 至 有 损 ， 对 于 对 数 转 换 和 logit 转换 的 改 
也 非常 有 限 。 总 体 率 <0.05 时 ， 单 个 率 Meta 分 析 汇 总 的 率 偏 倚 较 大 。 结 论 单个 率 的 Meta 
分 析 中 平方 根 反 正弦 转换 表现 最 佳 。 总 体 率 <0.05 时 使 用 Meta 分 析 宜 谨慎 。 
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[Abstract] Objective To compare different data transformations in Meta analysis for single 
proportions. Methods Two simulation data were constructed for Meta analysis under fixed effect 
model and random effect model, different adding values when event number was zero, and five 
different data transformation methods (raw proportion, log transformation, logit transformation, 
arcsine transformation and double arcsine transformation). Mean of pooled portion, bias, 
proportion bias, mean squared error, proportion mean squared error, proportion mean squared 
error and 95% confidence coverage were calculated. Results For Meta analysis of single 
proportions based on binomial distribution, generally, arcsine transformation performed best. 
When event number was zero, different values added to it did not improve the result much. Bias 
of pooled proportion was rather big when the population proportion is below 0.05. Conclusion 
Arcsine data transformation performed best during the simulation study for Meta analysis of 
single proportions. Caution should be used when dealing with population proportion less than 
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0.05. 
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1 引言 

Meta 分 析 有 多 种 类 型 ， 单 个 率 的 Meta 分 析 主 要 基于 横断 面 研究 的 无 对 照 二 分 类 数据 ， 
这 类 数据 常用 于 患 病 率 、 检 出 率 、 知 晓 率 、 病 死 率 及 感染 率 等 的 调查 。 这 类 数据 的 特点 是 
仅 有 单 组 事件 发 生 数 和 观察 总 数 ， 而 无 对 照 组 。 本 研究 关注 的 是 这 类 数据 的 Meta 分 析 。 
单个 率 Meta 分 析 的 数据 对 象 属于 计数 资料 。 计 数 资料 的 描述 包括 比 、 比 例 和 率 等 ， 但 
这 些 名 称 在 临床 研究 的 实际 使 用 中 往往 容易 混淆 ， 一 般 来 说 ， 应 注意 比例 〈proportion， 如 
患 病 率 、 治 愈 率 等 ) 和 率 〈rate 或 incidence， 发 生 率 ， 如 死亡 率 、 发 病 率 等 ) 的 区 别 。 本 
研究 不 包括 以 时 间 事 件数 据 表达 的 率 ， 也 不 包括 诊断 试验 中 的 敏感 性 、 特 异性 等 效应 量 。 
单个 率 Meta 分 析 通 常 采用 倒 方 差 法 进行 合并 ， 因 此 在 样本 量 或 率 较 小 时 ， 常 需要 进行 
适当 的 数据 转换 。 许 多 软件 提供 了 不 同 的 数据 转换 方法 ， 如 不 转换 《直接 使 用 原始 率 ) 、 
对 数 转 换 、logit 转换 、 平 方 根 反 正弦 转换 、 双 重 反 正 弱 转换 等 。 但 在 实际 操作 中 具体 应 在 
什么 情况 下 转换 ， 首 选 何 种 转换 方法 并 不 明确 。 本 研究 拟 通过 模拟 分 析 ， 比 较 单个 率 Meta 
分 析 不 同方 法 数据 转换 的 结果 ， 为 这 一 类 型 的 Meta 分 析 的 方法 选用 提供 理论 依据 。 


2 方法 
2.1 模拟 数据 

模拟 构建 2 套用 于 单个 率 Meta 分 析 的 数据 ， 验 证 5 种 率 的 转换 方法 的 结果 。 

模拟 数据 1 为 参考 既往 文献 的 模拟 数据 站， 假定 有 9 个 研究 ， 样 本 量 从 20 开始 ， 以 20 
递增 直至 180。 假 设 每 个 研究 中 的 事件 数 符合 既定 的 样本 量 与 总 体 率 〈 如 患 病 率 ) 的 二 项 
分 布 。 在 固定 效应 模型 中 ， 假 设 患 病 率 真 值 是 固定 的 po， 分别 为 0.01、0.05 和 0.2。 对 于 随 
机 效应 模型 ， 考 虑 P 服 从 均 数 为 pp， 标准 差分 别 为 0.1Puo、0.2Po、0.5Po 及 Po 的 正 态 分 布 。 
这 样 总 共产 生 3+3*3=12 种 情形 。 对 每 种 情形 随机 抽样 1000 次 ， 对 每 一 次 抽样 进行 一 组 
Meta 分 析 ， 包 括 5 种 转换 方法 ， 对 于 事件 数 为 零 时 ， 考 察 数 值 增加 0、 0.1、0.2、0.3.…. 
0.9 及 1 等 情况 下 的 结果 ， 这 样 总 计 12*5*11*1000=660,000 次 Meta 分 析 。 

模拟 数据 2 为 医疗 并 发 症 模 拟 数据 。 假 定 有 5 个 研究 ， 样 本 量 分 别 为 
50、100、200、300、1000 (1 个 小 样本 ，3 个 中 等 样本 ,1 个 大 样本 ) ， 只 考虑 固定 效应 
模型 ， 并 发 症 率 从 0.01 至 0.2， 按 0.01 递增 ， 共 20 种 情况 。 每 种 条 件 下 抽样 1000 次 ， 
一 次 抽样 进行 一 组 Meta 分 析 ， 包 括 5 种 转换 方法 ， 事 件数 为 零 时 增加 0.5 或 不 变 ， 这 样 总 
计 20*5*2*1000=200,000 次 Meta 分 析 。 
2.2 单个 率 Meta 分 析 方 法 
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统计 软件 使 用 R《〈 版 本 3.5.2) ， 利 用 R 语 言 Meta 包 的 Metaprop 函数 ， 根 据 5 种 数据 
转换 方法 及 不 同 的 零 事 件 处 理 方式 进行 单个 率 的 Meta 分 析 。 对 每 种 条 件 下 的 1000 次 Meta 
分 析 ， 计 算 汇总 的 率 的 均值 (Mean) ， 偏 倚 值 (Bias〉、 偏 倚 率 (Proportion Bias) 、 误 差 
均 方 (Mean Squared Error, MSE) 、 误 差 均 方 百 分 比 〈pProportion MSE) 及 95% 可 信 区 间 的 
履 盖 率 〈Coverage) ， 有 具体 方法 见 以 下 公式 。 


因 正 态 近 似 法 构建 的 95% 可 信 区 间 ， 在 率 较 小 的 时 候 对 不 转换 的 情况 显然 不 利 ， 为 避 
免 研 究 偏 傈 ，95% 可 信 区 间 的 计算 一 律 采 用 Clopper-Pearson 方法 。 


3 结果 
3.1 模拟 数据 1 结果 

图 1 给 出 了 固定 效应 模型 的 结果 (Po=0.05) ， 横 坐标 是 事件 数 为 零 时 的 增加 值 (由 0 
至 1， 按 0.1 递 增 ) 。 由 A 栏 可 以 看 出 ， 汇 总 率 的 均值 ， 以 绿色 的 平方 根 反 正弦 转换 和 蓝 色 
的 双重 反正 弦 转 换 最 接近 0.05。 原 始 率 的 结果 较 差 ， 事 件数 为 零 时 的 增加 值 对 汇总 率 有 较 
明显 的 影响 ， 但 校正 的 结果 并 不 满意 。 相 应 的 ，B 栏 是 偏 倚 百 分 比 ， 仍 然 是 平方 根 反 正弦 
法 偏 傈 率 的 绝对 值 最 小 ， 双 重 反 正弦 转换 、logit 和 对 数 转换 紧 随 其 后 。C 栏 是 误差 均 方 百 
分 比 ，D 栏 是 95% 可 信 区 间 的 履 盖 率 ， 在 这 两 个 参数 上 4 种 转换 方法 的 结果 都 非常 接近 ， 
明显 优 于 不 转换 的 情况 。 表 1 列 出 了 事件 数 为 零 时 数值 不 变 或 增加 0.5 的 两 种 情况 的 具体 
数值 。 
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pooled proportion 
0.030 0.040 0.050 0.060 


0.003 0.006 


MSE percentage 


0.000 


0.0 0.2 0.4 0.6 


value add for zero event 


-0.1 0.1 


bias percentage 


-0.3 


0.7 0.9 


95% CI coverage 


0.5 


一 9 一 9 一 9 一 9 一 9 一 6 一 6 一 9 一 9 一 9 


0.0 0.2 0.4 


0.6 


value add for zero event 


图 1 固定 效应 模型 结果 Po=0.05 


横 坐标 均 为 当 事 件数 为 零 时 的 增加 值 。A 为 ; 
信 区 间 履 盖 率 。 黑 色 为 原始 率 ， 红 色 为 对 数 转 换 ， 橙 色 为 logit 转换 ， 绿 色 为 3 


[总 率 的 均值 ，B 为 1 


双重 反正 弦 转 换 。 


扁 倚 率 ，C 为 误差 均 方 百分比 ，D 为 95% 可 


表 1 单个 率 Meta 分 析 国 定 效 应 模型 Po=0.05 


增 加 
转换 


原始 率 
对 数 

0 logit 
平方 根 反 正弦 
双重 反正 弦 
原始 率 
对 数 

0.5 logit 
平方 根 反 正弦 
双重 反正 弦 


均值 


0.043591 
0.055594 
0.054915 
0.047652 
0.045653 
0.041248 
0.055243 
0.054543 
0.047652 
0.045653 


偏 倚 率 


-0.128183 
0.111872 
0.098300 
-0.046956 
-0.086935 
-0.175034 
0.104857 
0.090865 
-0.046956 
-0.086935 


误差 均 方 百 分 
比 
0.0022312 
0.0018431 
0.0016486 
0.0013097 
0.0015500 
0.0031139 
0.0017666 
0.0015768 
0.0013097 
0.0015500 


方 根 反 了 ] 


为 


0.766 
0.885 
0.908 
0.900 
0.898 
0.668 
0.893 
0.914 
0.900 
0.898 


十 淘 


E 弱 转换 ， 蓝 色 为 


类 似 的 ， 图 2 是 随机 效应 模型 的 结果 〈pP=0.05，SD=0.005) ， 由 A 栏 可 以 看 出 汇总 率 
的 均值 ， 以 绿色 的 平方 根 反 正弦 转换 和 蓝 色 的 双重 反 了 
较 差 ， 事 件数 为 零 时 的 增加 值 对 汇总 率 有 较 明 显 的 影响 ， 但 校正 的 结果 并 不 满意 。 对 数 转 


换 和 logit 转换 的 结果 也 较 差 。 相 应 的 ，B 栏 
正弦 转换 的 偏 倚 率 的 绝对 值 最 小 ， 原 始 率 、logit 和 对 数 转换 的 结果 较 差 。C 栏 


E 弦 转换 最 接近 0.05， 原 始 率 的 结果 


是 偶 倚 百分比 ， 仍 然 是 平方 根 反 正弦 和 双重 反 


日 


是 误差 均 方 


百分比 ， 平 方 根 反 正弦 和 双重 反正 弦 转 换 最 优 。D 栏 是 95% 可 信 区 间 的 覆盖 率 ， 平 方 根 反 
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正弦 转换 和 双重 反正 弦 最 优 旦 几乎 


两 种 情况 的 具体 数值 。 另 外 ， 在 随机 效应 模 
率 的 偏 倚 率 和 和 履 盖 率 也 逐渐 变 差 (结果 未 呈现 )。 
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sse 


0.2 


登 。 表 2 列 出 了 事件 数 为 零 时 数值 不 变 或 增加 0.5 的 
型 中 ， 随 着 并 发 症 率 P 的 标准 差 的 增加 ， 汇 总 


23 一 9 一 8 一 2 一 9 一 2 一 8 一 9 一 2 一 8 一 


bias percentage 
-02 -01 00 0.1 


95%Cl coverage 


0.2 0.4 0.6 0.8 1.0 


value add for zero event 


value add for zero event 


2 随机 效应 模型 P=0.05, SD=0.005 
A 为 汇总 率 的 均值 ，B 为 偏 倚 率 ，C 为 误差 均 方 百 分 比 ，D 为 95% 可 信 区 间 和 覆盖 率 。 黑 色 为 原始 率 ， 红 色 为 
对 数 转 换 ， 构 色 为 logit 转换 ， 绿 色 为 平方 根 反 正弦 转换 ， 蓝 色 为 双重 反正 弦 转 换 。 


表 2 单个 率 Meta 分 析 随 机 效应 模型 P=0.05,SD=0.005 


增加 
本 转换 


原始 率 
对 数 

0 logit 
平方 根 反 正弦 
双重 反正 弦 
原始 率 

0.5 logit 
平方 根 反 正弦 
双重 反正 弦 


3.2 模拟 数据 2 结果 


均值 


0.048657 
0.058286 
0.057686 
0.050537 
0.049107 
0.046953 
0.057821 
0.057206 
0.050537 
0.049107 


偏 倚 率 


-0.026854 
0.165720 
0.153725 
0.010749 
-0.017867 
-0.060942 
0.156419 
0.144113 
0.010749 
-0.017867 


误差 均 方 百 分 

着 : 
0.0012430 0.933 
0.0026361 0.836 
0.0024035 0.855 
0.0013151 0.958 
0.0012338 0.959 
0.0014082 0.926 
0.0024752 0.850 
0.0022496 0.870 
0.0013151 0.958 
0.0012338 0.959 


图 3 显示 了 模拟 数据 2 即 假想 并 发 症 数据 的 结果 ， 横 坐标 为 并 发 症 的 总 体 率 (从 0.01 
至 0.2， 按 0.01 递增 ) 。A 栏 和 B 栏 都 是 偏 倚 率 ，A 栏 为 当 事 件数 为 零 时 保持 不 变 ，B 栏 则 
增加 0.5。 由 A 栏 可 以 看 出 在 总 体 率 <0.05 时 ， 各 方法 的 偏 倚 率 都 较 大 ， 但 偏 倚 率 随 着 总 体 
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率 的 增加 而 迅速 减 小 。 对 数 转换 和 logit 转换 高 佑 了 并 发 症 率 ， 而 不 转换 、 平 方 根 反 正弦 和 


双重 反正 弦 转 换 均 低估 了 并 发 症 率 。 总 体 上 绿色 


的 平方 根 反 正弦 转换 的 偏 倚 率 的 绝对 值 最 


= 


小 。B 栏 显示 增加 0.5 后 偏 倚 率 改善 不 明显 ， 且 原始 率 的 偏 倚 率 反而 变 差 。C 栏 为 误差 均 方 
百分比 ，D 栏 为 95% 可 信 区 间 的 履 盖 率 ， 平 方 根 反正 弦 、 对 数 及 logit 转换 后 的 履 盖 率 较 高 。 
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3 并 发 症 模 拟 数据 Meta 分 析 的 结果 


横 坐 标 为 并 发 症 的 总 体 率 ， 从 0.01 至 0.2， 按 0.01 递增 。 
变 ，B 增加 0.5。C 为 误差 均 方 百分比 ，D 为 95% 可 信 区 间 


A、B 均 为 汇总 率 的 均值 ， 当 事件 数 为 零 时 ，A 不 
履 盖 率 ， 黑 色 为 原始 率 ， 红 色 为 对 数 转 换 ， 橙 色 


为 logit 转换 ， 绿 色 为 平方 根 反 正弦 转换 ， 蓝 色 为 双重 反正 弦 转 换 ， 紫 色 为 当 事 件数 为 零 时 ， 原 始 率 的 事 


4 讨论 


件数 增加 0.5。 


本 研究 通过 模拟 分 析 ， 发 现 对 基于 二 项 分 布 的 单个 率 进行 Meta 分 析 ， 平 方 根 反 正弦 转 
固定 值 对 结果 影响 较 大 ， 但 这 种 校正 对 不 
转换 的 策略 没有 帮助 ， 甚 至 有 损 ， 对 对 数 转换 和 logit 转换 改善 非常 有 限 。 事 件数 为 零 时 不 
影响 平方 根 反 正弦 和 双重 反正 弦 的 结果 。 总 体 率 小 于 0.05 时 ，Meta 分 析 汇 总 的 率 偏 倚 较 大 。 


换 总 体 表现 最 佳 。 当 事件 数 为 零 时 ， 增 加 不 同 的 


单个 率 的 Meta 分 析 采 用 倒 方 差 法 合并 时 ， 率 较 小 时 获得 的 权重 过 大 。 此 时 应 考虑 率 


不 同 的 转换 方法 。 根 据 数据 的 特点 和 转换 的 目的 ， 数 据 转 换 可 有 不 同 的 方法 点 ， 而 用 了 


的 


单 


个 率 Meta 分析 的 率 的 转换 的 常见 方法 有 以 下 5 种 : 1) 不 转换 (原始 率直 接 计算 ) ，2) 对 
数 转换 ，3) logit 转换 ，4) 平方 根 反 正弦 转换 及 5) 双重 反正 弦 转 换 (double arcsine 


transformation， 又 称 Freeman-Tukey transformation ) 下 35， 这 些 方法 多 已 纳入 Meta 分 析 


统计 软件 中 。 


的 


但 具体 操作 时 何 时 选用 哪 种 转换 方法 尚 无 定论 。 国 内 有 一 些 单个 率 Meta 分 析 软 件 使 用 
的 介绍 59， 检 索 国 外 文献 ， 类 似 研 究 也 不 多 见 上 4。Trikalinos 等 外 对 单个 比例 和 发 生 率 的 
Meta 分 析 分 别 进行 了 进行 模拟 研究 ， 在 单个 比例 的 Meta 分 析 中 ， 根 据 比 例 的 分 布 、 均 值 、 
方差 、 研 究 个 数 及 研究 样本 量 等 构建 了 700 余 种 Meta 分 析 的 情形 ， 对 每 种 情形 进行 1000 
次 随机 抽样 模拟 ， 同 时 考察 固定 效应 模型 和 随机 效应 模型 。 率 的 转化 包括 了 不 转换 、logit 
转换 和 平方 根 反正 弦 转 换 等 3 种 方法 ， 将 Meta 分 析 得 到 的 率 与 假设 的 真 值 率 进行 比较 ， 比 
较 的 指标 包括 差 值 、 差 值 百分比 、 均 方差 、 均 方差 的 百分比 、 以 及 95% 可 信 区 间 《单个 分 
析 以 Wald 法 计算 ， 再 汇总 1000 个 分 析 ) 覆盖 真 值 的 比例 ， 结 果 显 示 平 方 根 反正 弦 转 换 是 
较 好 的 方法 。 本 研究 的 结果 与 之 一 致 。Barendregt 等 中 对 患 病 率 〈Prevalence) 的 Meta 分 析 
进行 了 模拟 研究 ， 假 设 了 样本 量 为 20-180 的 9 个 研究 ， 设 定 患 病 率 为 0.05， 随 机 效应 模型 
时 假设 患 病 率 在 不 同 的 研究 中 为 正 态 分 布 ， 均 值 为 0.05， 标 准 差 为 0.005。 进 行 1000 次 随 
机 抽样 ， 率 的 转换 方法 包括 了 不 转换 、logit 转换 及 双重 反正 弦 转 换 等 3 种 方法 。 该 研究 比 
较 了 Meta 分 析 得 到 的 值 与 假设 的 真 值 的 偏差 、 均 方差 及 95% 可 信 区 间 (也 是 Wald 法 计 
算 ) 履 盖 真 值 的 比例 ， 结 果 双 重 反 正 弱 法 略 优 于 logit 转换 (如 固定 效应 模型 时 的 偏 倚 率 在 
原始 率 、logit 转换 及 双重 反正 弦 转 换 中 分 别 为 -0.022，0.004，0.002) 。 本 研究 在 模拟 数据 
1 部 分 的 结果 与 之 相似 ， 在 固定 效应 模型 中 ， 两 者 接近 ; 而 在 随机 效应 模型 中 双重 反正 弦 
转换 优 于 logit 转换 。 在 模拟 数据 2 部 分 的 结果 中 ， 双 重 反 正弦 转换 与 logit 转换 的 结果 也 较 
为 接近 ， 且 logit 转换 在 误差 均 方 百分比 及 覆盖 率 指标 上 明显 更 优 ， 但 都 不 如 平方 根 反正 弦 
转换 。 

上 述 的 两 个 研究 各 自 都 只 比较 了 3 种 率 的 转换 方法 ， 且 没有 平方 根 反正 弦 转 换 与 双重 
反正 弦 转 换 的 直接 对 比 。 而 且 Barendregt 等 目的 研究 假设 情形 较为 单一 。 本 研究 比较 了 5 种 
率 的 转换 方法 ， 并 且 在 两 套 模拟 数据 中 都 显示 平方 根 反 正弦 转换 最 优 。 

本 研究 的 主要 局 限 在 于 : 1) 统计 软件 只 选择 了 R， 不 一 定 能 代表 其 他 的 软件 。R 软件 
作为 一 款 免费 的 软件 ， 功 能 强大 而 灵活 ， 应 用 越 来 越 广泛 ， 且 当前 使 用 R 作 Meta 分 析 的 研 
究 也 越 来 越 多 。2) 模拟 分 析 的 情景 仍 不 够 丰富 。 但 本 研究 设计 了 两 套 模拟 数据 ， 考 察 了 事 
件数 为 零 时 增加 不 同 的 固定 值 ， 及 总 体 率 从 0.01 至 0.2 的 情况 ， 应 当 具 有 一 定 的 代表 性 。 

总 之 ， 本 研究 认为 单个 率 Meta 分 析 ， 宣 选用 平方 根 反 正弦 转换 ， 而 事件 数 为 零 时 增加 
一 国定 值 的 做 法 并 不 能 明显 改善 结果 。 
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